Web Profunda o Invisible es el término utilizado para describir toda la información disponible en Internet que no es recuperada interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.
Según el estudioHow much Information? 2003,realizado porPeter Lyman y Hal Varian de la School of Information Management and Systems de la Universidad de California, Berkeley, la cantidad de información de la Web navegable o visible es de 167 terabytes, mientras que la Web invisible o profunda es de 91.850 terabytes.(http://www.sims.berkeley.edu/research/projects/how-much-info-2003/printable_report.pdf)
Recursos de búsqueda en la Web Profunda por tipo de recurso
El web como sistema de información de Lic. Keilyn Rodríguez Perojoy Lic. Rodrigo Ronda León, sobre la diferencia entre la Web Superficial y la Web Profunda: En 1994, la Dra. Jill Ellsworth, especializada en el estudio de Internet, utilizó el término Web invisible , por primera vez, para denominar a la información que resultaba “invisible” para los motores de búsqueda convencionales en el Web. También, se denomina “Web profundo” (Deep Web), por oposición a la “Web superficial” (Surface Web) cuya información puede recuperarse con los buscadores de Internet. La existencia de esta denomina red profunda es un producto de la metodología que utilizan los buscadores para indexar las páginas. El mecanismo se basa en programas llamados robots o arañas, que recorren las páginas de la red siguiendo los enlaces que presentan o se dirigen hacia ellas. Cuando se utiliza alguno de los buscadores conocidos, no se busca en toda la red, sino en su base de datos, construida gracias a la acción de los robots. A pesar de su pretendida exhaustividad, se calcula que los mayores motores de búsqueda (Google, AlltheWeb) indizan sólo entre un tercio y la mitad de los documentos disponibles para el público en la red. El Web profundo almacena páginas dinámicas que se obtienen como respuesta a interrogantes directas a bases de datos, así como documentos en diversos formatos (mp3. doc, pdf, wma, avi, entre otros), la mayor parte de esta información no se recupera por medio de los directorios y buscadores tradicionales. En el año 2000, un estudio de la consultora estadounidense BrightPlanet, elaborado por Michael Bergman , confirmaba y explicaba la existencia de una red profunda que tendría aproximadamente 7 500 terabytes (equivalente a 7 500 billones de bytes) de información frente a los 19 de la Web superficial o parte de la red accesible mediante los buscadores convencionales. Actualmente, existen herramientas orientadas específicamente a la labor de recuperar información en el Web profundo como: buscadores, agentes de búsquedas, índices generales y portales verticales. Estas herramientas facilitan el acceso a una mayor parte del Web, porque, además de buscar en el Web superficial, buscan en el Web profundo también, inaccesible para la mayor parte de los buscadores tradicionales. El desarrollo de las herramientas del Web superficial, cuantitativamente superiores a las herramientas orientadas a la recuperación de información en el Web profundo, las primeras con más de una década de desarrollo y las segundas con alrededor de 5 años de existencia, no pueden resolver problemas técnicos que limitan la cobertura y accesibilidad (en términos de cantidad y calidad) a las fuentes de información disponibles. La sobrecarga de información en el Web supone un gran reto para las organizaciones, especialmente en el manejo de grandes volúmenes de datos para conocer el entorno y predecir su evolución, porque muchas veces poseen la información necesaria para responder a las solicitudes de determinados segmentos de usuarios en el mercado, pero en ocasiones no son capaces de aprovechar al máximo esta información por no tenerla organizada adecuadamente y carecer de los métodos necesarios para procesarla y analizarla de la mejor manera.
La web profunda, o invisible, es la información que generalmente se almacena y se accede mediante una base de datos a través de paginas dinámicas y aunque contienen información de acceso libre, contienen otras en la cual es necesario estar registrado para poder obtener la información deseada.
Se caracteriza en cuatro tipos, según Sherman y Price: -La web opaca: Esta se compone de archivos que podrían ser encontradas a través de un buscador convencional, pero por alguna razón no están. -La web privada: Son las páginas web que podrían estar indizadas en los motores de búsqueda, pero que por alguna causa son excluidas deliberadamente por falta de utilidad. -La web propietaria: Son las que requieren un registro, ya sea de forma gratuita o pagada, para acceder a la información. -La web realmente invisible: Son las que debido a limitaciones del buscador no pueden ser indizadas por los mismos.
Video sugerencia sobre aspectos sobre la WEB PROFUNDA, muy interesante deberas, este es el link:
La Web semántica: en el año 2003 se la definía como un conjunto de in iciativas tecnológicas en su mayor parte destinadas a crear una futura World Wide Web en la cual las computadoras pudieran procesar la información como si tuvieran inteligencia.
La idea era entonces codificar las páginas con un nuevo lenguaje, de modo que los motores de búsqueda pudieran interpretar las preguntas del usuario y encontrar realmente aquello que él está buscando en el océano de archivos de lo que llamamos la Web profunda. Se trataría de una verdadera inteligencia artificial.Se presentaba entonces, y en parte sigue siendo hoy, como un objetivo loable, deseable pero muy difícil de alcanzar, ya que implica un cambio en la manera de trabajar de todos aquellos que se dedican a producir archivos en la WEB.(Fuente: Internet invisible y web semántica:¿el futuro de los sistemas de información en línea? Lluís Codina UPF (Junio 2003))
Según artículos más recientes las tecnologías que apoyarían a la web semántica siguen en ascenso y ya se utilizan en numerosas aplicaciones.
La Web semántica, por extensión la Web de los metadatos, noción aparecida en 1994, se basa en un conjunto de tecnologías pensadas en volver el contenido de los recursos (imágenes, textos, vídeos, etc.) de la Web más accesibles y más utilizables por los internautas. La Web semántica fue creada por la World Wide Web Consortium (W3C), el organismo de estandarización de los lenguajes web. Este sistema permite unir las informaciones que hasta ese momento fueron tratadas por separado.
Los lenguajes detrás de la Web semántica actualmente son utilizados en diferentes dominios de aplicaciones, por ejemplo en las redes sociales permite agregar varios datos (por ejemplo para una imagen: el lugar, la fecha, el nombre de las personas, el autor, la fecha de grabación, etc.), o para enriquecer las posibilidades de búsqueda de informaciones y conectarse con otros miembros, para la búsqueda bibliográfica o documental (en la Biblioteca Nacional de Francia se han realizado experiencias para efectuar búsquedas simultáneas a través de varias colecciones patrimoniales digitales (en diferentes lenguas). El objetivo fue crear más vínculos entre los datos de los catálogos y hacerlos más visibles en la Web.. Gigantes de la Web como Facebook o Google están introduciendo tecnologías basadas en la Web semántica para facilitar el acceso a la información.(Fuente:Web semántica: aplicaciones actuales - mayo 2013 http://es.kioskea.net/faq/7082-web-semantica-las-aplicaciones-actuales )
Web Profunda o Invisible es el término utilizado para describir toda la información disponible en Internet que no es recuperada interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.
Según el estudio How much Information? 2003, realizado por Peter Lyman y Hal Varian de la School of Information Management and Systems de la Universidad de California, Berkeley, la cantidad de información de la Web navegable o visible es de 167 terabytes, mientras que la Web invisible o profunda es de 91.850 terabytes.(http://www.sims.berkeley.edu/research/projects/how-much-info-2003/printable_report.pdf)
Recursos de búsqueda en la Web Profunda por tipo de recurso
- Buscadores:
- Metabuscadores:
- Directorios:
- Guías:
y la prevención de la violencia de género.
http://www.educarenigualdad.org/material
El web como sistema de información de Lic. Keilyn Rodríguez Perojoy Lic. Rodrigo Ronda León, sobre la diferencia entre la Web Superficial y la Web Profunda:
En 1994, la Dra. Jill Ellsworth, especializada en el estudio de Internet, utilizó el término Web invisible , por primera vez, para denominar a la información que resultaba “invisible” para los motores de búsqueda convencionales en el Web. También, se denomina “Web profundo” (Deep Web), por oposición a la “Web superficial” (Surface Web) cuya información puede recuperarse con los buscadores de Internet. La existencia de esta denomina red profunda es un producto de la metodología que utilizan los buscadores para indexar las páginas. El mecanismo se basa en programas llamados robots o arañas, que recorren las páginas de la red siguiendo los enlaces que presentan o se dirigen hacia ellas. Cuando se utiliza alguno de los buscadores conocidos, no se busca en toda la red, sino en su base de datos, construida gracias a la acción de los robots.
A pesar de su pretendida exhaustividad, se calcula que los mayores motores de búsqueda (Google, AlltheWeb) indizan sólo entre un tercio y la mitad de los documentos disponibles para el público en la red. El Web profundo almacena páginas dinámicas que se obtienen como respuesta a interrogantes directas a bases de datos, así como documentos en diversos formatos (mp3. doc, pdf, wma, avi, entre otros), la mayor parte de esta información no se recupera por medio de los directorios y buscadores tradicionales.
En el año 2000, un estudio de la consultora estadounidense BrightPlanet, elaborado por Michael Bergman , confirmaba y explicaba la existencia de una red profunda que tendría aproximadamente 7 500 terabytes (equivalente a 7 500 billones de bytes) de información frente a los 19 de la Web superficial o parte de la red accesible mediante los buscadores convencionales.
Actualmente, existen herramientas orientadas específicamente a la labor de recuperar información en el Web profundo como: buscadores, agentes de búsquedas, índices generales y portales verticales. Estas herramientas facilitan el acceso a una mayor parte del Web, porque, además de buscar en el Web superficial, buscan en el Web profundo también, inaccesible para la mayor parte de los buscadores tradicionales.
El desarrollo de las herramientas del Web superficial, cuantitativamente superiores a las herramientas orientadas a la recuperación de información en el Web profundo, las primeras con más de una década de desarrollo y las segundas con alrededor de 5 años de existencia, no pueden resolver problemas técnicos que limitan la cobertura y accesibilidad (en términos de cantidad y calidad) a las fuentes de información disponibles. La sobrecarga de información en el Web supone un gran reto para las organizaciones, especialmente en el manejo de grandes volúmenes de datos para conocer el entorno y predecir su evolución, porque muchas veces poseen la información necesaria para responder a las solicitudes de determinados segmentos de usuarios en el mercado, pero en ocasiones no son capaces de aprovechar al máximo esta información por no tenerla organizada adecuadamente y carecer de los métodos necesarios para procesarla y analizarla de la mejor manera.
La web profunda, o invisible, es la información que generalmente se almacena y se accede mediante una base de datos a través de paginas dinámicas y aunque contienen información de acceso libre, contienen otras en la cual es necesario estar registrado para poder obtener la información deseada.
Se caracteriza en cuatro tipos, según Sherman y Price:
- La web opaca: Esta se compone de archivos que podrían ser encontradas a través de un buscador convencional, pero por alguna razón no están.
- La web privada: Son las páginas web que podrían estar indizadas en los motores de búsqueda, pero que por alguna causa son excluidas deliberadamente por falta de utilidad.
- La web propietaria: Son las que requieren un registro, ya sea de forma gratuita o pagada, para acceder a la información.
- La web realmente invisible: Son las que debido a limitaciones del buscador no pueden ser indizadas por los mismos.
Video sugerencia sobre aspectos sobre la WEB PROFUNDA, muy interesante deberas, este es el link:
http://www.youtube.com/watch?v=iQwTgr4FIcg
La Web semántica: en el año 2003 se la definía como un conjunto de in iciativas tecnológicas en su mayor parte destinadas a crear una futura World Wide Web en la cual las computadoras pudieran procesar la información como si tuvieran inteligencia.
La idea era entonces codificar las páginas con un nuevo lenguaje, de modo que los motores de búsqueda pudieran interpretar las preguntas del usuario y encontrar realmente aquello que él está buscando en el océano de archivos de lo que llamamos la Web profunda. Se trataría de una verdadera inteligencia artificial.Se presentaba entonces, y en parte sigue siendo hoy, como un objetivo loable, deseable pero muy difícil de alcanzar, ya que implica un cambio en la manera de trabajar de todos aquellos que se dedican a producir archivos en la WEB.(Fuente: Internet invisible y web semántica:¿el futuro de los sistemas de información en línea? Lluís Codina UPF (Junio 2003))
Según artículos más recientes las tecnologías que apoyarían a la web semántica siguen en ascenso y ya se utilizan en numerosas aplicaciones.La Web semántica, por extensión la Web de los metadatos, noción aparecida en 1994, se basa en un conjunto de tecnologías pensadas en volver el contenido de los recursos (imágenes, textos, vídeos, etc.) de la Web más accesibles y más utilizables por los internautas. La Web semántica fue creada por la World Wide Web Consortium (W3C), el organismo de estandarización de los lenguajes web. Este sistema permite unir las informaciones que hasta ese momento fueron tratadas por separado.
Los lenguajes detrás de la Web semántica actualmente son utilizados en diferentes dominios de aplicaciones, por ejemplo en las redes sociales permite agregar varios datos (por ejemplo para una imagen: el lugar, la fecha, el nombre de las personas, el autor, la fecha de grabación, etc.), o para enriquecer las posibilidades de búsqueda de informaciones y conectarse con otros miembros, para la búsqueda bibliográfica o documental (en la Biblioteca Nacional de Francia se han realizado experiencias para efectuar búsquedas simultáneas a través de varias colecciones patrimoniales digitales (en diferentes lenguas). El objetivo fue crear más vínculos entre los datos de los catálogos y hacerlos más visibles en la Web.. Gigantes de la Web como Facebook o Google están introduciendo tecnologías basadas en la Web semántica para facilitar el acceso a la información.(Fuente:Web semántica: aplicaciones actuales - mayo 2013 http://es.kioskea.net/faq/7082-web-semantica-las-aplicaciones-actuales )